Фрагмент для ознакомления
2
Задача 7
Имеются данные о потребительских расходах на душу населения (у, р.), средней заработной плате и социальных выплатах (х, р.) по 16 районам региона
Районы Февраль
у х
A 420 1305
B 512 1440
C 430 1230
D 230 1275
E 505 1700
F 402 1480
G 430 1305
H 400 895
I 410 775
J 585 1000
K 370 1035
L 384 1150
M 345 1215
N 445 1010
O 485 1059
P 491 1051
Задание:
Рассчитать параметры уравнений регрессии и .
Оценить тесноту связи с помощью индексов корреляции и детерминации.
Рассчитать средний коэффициент эластичности и дать сравнительную оценку силы связи фактора с результатом.
Рассчитать среднюю ошибку аппроксимации и оценить качество модели.
С помощью F-статистики Фишера (при α=0,05) оценить надёжность регрессии уравнения.
Рассчитать прогнозное значение , если прогнозное значение фактора увеличится на 5 % от его среднего значения. Определить доверительный интервал прогноза для α=0,05.
Решение: Составим расчётную таблицу (таблица 1), расчёты ведём по формулам:
σ_x^2=(x^2 ) ̅-(x ̅ )^2=1451022,313-〖1182,813〗^2=51976,902
σ_x=√(σ_x^2 )=√51976,902=227,984
σ_y^2=(y^2 ) ̅-(y ̅ )^2=189119,375-〖427,75〗^2=6149,313
σ_y=√(σ_y^2 )=√6149,313=78,418
b=((xy) ̅-x ̅*y ̅)/(σ_x^2 )=(506607,563-1182,313*427,75)/51976,902=0,013
a=y ̅-bx ̅=427,75-0,013*1182,813=412,742
Линейное уравнение регрессии имеет вид y ̂=412,742+0,013x.
Рассчитаем линейный коэффициент парной корреляции:
r_xy=b*σ_x/σ_y =0,013*227,984/78,418=0,037.
Так как значение коэффициента корреляции близко к нулю, связь между признаками х и у слабая.
Рассчитаем значение F-критерия Фишера
F_факт=〖r_xy〗^2/(1-〖r_xy〗^2 )*(n-m-1)/m=0,001/(1-0,001)*(16-1-1)/1=0,019
По таблице приложения 1 в методическом указании находим
Так как Fрасч < Fтабл, то гипотеза об отсутствии линейной связи между признаками (H0: b = 0) подтверждается.
Так как 〖r_xy〗^2 = 0,001 (коэффициент детерминации), это означает, что 0,1% результата объясняется вариациями объясняющей переменной.
Для оценки качества модели рассчитаем среднюю ошибку аппроксимации:
A ̅=1/n ∑▒〖|(y-y ̂)/y|*100〗%=15,197%.
Так как средняя ошибка аппроксимации вышла за допустимые пределы (8-10%), это говорит о неудачном выборе модели регрессии.
Выберем в качестве модели уравнение регрессии y=a+b√x+ε, предварительно линеаризовав модель, для этого обозначим √x=z, получим линейное уравнение парной регрессии y=a+bz+ε.
Все промежуточные расчёты поместим в таблицу 2.
Расчёты ведём по формулам:
σ_z^2=(z^2 ) ̅-(z ̅ )^2=1182,813-〖34,234〗^2=10,875
σ_z=√(σ_z^2 )=√10,875=3,298
σ_y^2=6149,313
σ_y=√(σ_y^2 )=√6149,313=78,418
b=((zy) ̅-z ̅*y ̅)/(σ_z^2 )=(14649,341-34,234*427,75)/10,875=0,545
a=y ̅-bz ̅=427,75-0,545*34,234=409,085
Уравнение регрессии имеет вид y ̂=409,085+0,545z.
.
Коэффициент корреляции
r_zy=b*σ_z/σ_y =0,545*3,298/78,418=0,023.
Так как значение коэффициента корреляции близко к нулю, связь между признаками z и у слабая.
Так как 〖r_zy〗^2 = 0,001 (коэффициент детерминации), это означает, что 0,1% результата объясняется вариациями объясняющей переменной.
Рассчитаем значение F-критерия Фишера
F_факт=〖r_zy〗^2/(1-〖r_zy〗^2 )*(n-m-1)/m=0,001/(1-0,001)*(16-1-1)/1=0,019
По таблице приложения 1 в методическом указании находим
Так как Fрасч < Fтабл, то гипотеза об отсутствии линейной связи между признаками (H0: b = 0) подтверждается.
Для оценки качества модели рассчитаем среднюю ошибку аппроксимации:
A ̅=1/n ∑▒〖|(y-y ̂)/y|*100〗%=15,227%, то, что средняя ошибка аппроксимации вышла за допустимые пределы (8-10%), это говорит о неудачном выборе модели регрессии.
Вывод: Оба уравнения регрессии статистически незначимы в целом.
Задача 17
Имеются данные за 12 месяцев по району города о рынке вторичного жилья, (у – стоимость квартиры, тыс. у.е.; х1 – размер жилой площади, м2; х2 – размер кухни, м2).
у х1 х2
13,2 46,0 5,8
15,9 54,1 8,5
16,2 50,6 8,0
15,4 43,8 5,2
14,2 78,6 12,0
11,0 60,2 7,2
21,1 50,2 7,0
13,4 54,7 7,3
15,6 42,8 5,5
12,8 60,4 7,3
14,5 47,2 5,8
15,1 40,6 5,2
Задание:
Рассчитать параметры линейного уравнений множественной регрессии.
Дайте оценку силы связи факторов с результатом с помощью среднего коэффициента эластичности.
Оцените статистическую значимость параметров и уравнения регрессии в целом с помощью соответственно критериев Стьюдента и Фишера (α=0,01).
Рассчитать среднюю ошибку аппроксимации. Сделайте вывод.
Составьте матрицы парных и частных коэффициентов корреляции и укажите информативные факторы.
Оцените полученные результаты, выводы оформите в аналитической записке.